第一章 马氏链
1.1 定义与例子
-
定义1. pij≥0,∑j∈Spij=1. 得到矩阵P。称之为S上的一个转移概率矩阵,或转移矩阵。称pij为从i到j的转移概率。
-
定义2. 若转移矩阵P使得
P(Xn+1=j∣Xn=i,X0=i0,⋯,Xn−1=in−1)=pij
则称{Xn} 是S上的一个**(时齐的)马尔科夫链**。
马氏链的关键在于未来状态仅依赖于当前状态,而不依赖于过去的状态。
例子:
- (d维)简单随机游动
- 两状态马氏链
- 图上的随机游动
有限维联合分布
- 命题1. 令Yn=Xn+m. 那么,在Xn=i的条件下,{Ym}是从i出发的马氏链,且它与(X0,⋯,Xn−1)独立。
记P(Xm+n=j∣Xn=i)为pij(m).
-
命题2. (Chapman−Kolmogrov 等式)
pij(n+m)=k∈S∑pik(n)pkj(m)
-
推论:pij(n)=(Pn)ij
称Pn为n步转移矩阵。
马氏链的构造(递归)
设P是一个转移矩阵,μ为S上的一个分布。取独立同分布的随机变量序列U0,U1,⋯,使得Ui服从(0,1)上的均匀分布。
取g:(0,1]→S 使得
g(u):=i, ∀u∈(r=1∑i−1μj,r=1∑iμj]
那么,
P(g(U0)=i)=P(r=1∑i−1μj<U≤r=1∑iμj)=μj
即 g(U0)∼μ
g刻画了初始分布
取f(i,⋅):(0,1]→S 使得
f(i,u):=j, ∀u∈(r=1∑j−1pir,r=1∑jpir]
那么,
P(f(i,Un)=i)=P(r=1∑j−1pir<U≤r=1∑jpir)=pij
f刻画了转移矩阵
令X0:=g(U0),并递归定义Xn+1:=f(Xn,Un+1).
1.2 不变分布与可逆分布
- 定义1. 假设π={πj:j∈S}为S上的测度。若π满足以下不变方程:
πj=k∈S∑πk pkj,∀j∈S
则称π为P的一个不变测度。若π还是分布,则称为不变分布。
假设 π 为不变分布。如果 X0∼π,那么,
(X0,X1,⋯,Xn)=d(Xm,Xm+1,⋯,Xm+n),n,m⩾1,
其中,“=d”表示同分布。满足上式的过程被称为平稳过程。对于一个平稳过程,任意时刻 m 都可以被视为时间起点。对于马氏链而言,因为同样的初分布带来同样的有限步轨道分布。因此,不变分布也被称为平稳分布。
-
若S有限,则可将π视为行向量,我们有π=πP,即π是P的特征值为1的行向量。
-
对S的任意子集A,
i=1,j∈A∑πipij=i∈A,j∈/A∑πipij
此式与π是不变分布等价。
-
利用空间的平移不变性。
细致平衡条件:
πipij=πjpji,∀i,j∈S
- 定义2. 假设 P 不可约,π 为 S 上的一个测度。若细致平衡条件成立,则称 π 为 P 的配称测度。此时,称 P 为可配称的。进一步,若 π 是一个分布,则称 π 为 P 的可逆分布。此时,称 P 为可逆的。
一个转移矩阵不可约指的是从任意一个状态都可以到达任意一个状态。
- 定义3. 设π是不变分布。固定N,令Yn:=XN−n,则{Yn:0≤n≤N}被称为{Xn:0≤n≤N}的时间倒逆过程,简称逆过程。{Yn:0≤n≤N}的转移概率为
p~ij=πiπjpji,∀i,j∈S.
因此,π是可逆分布指P~=P。
-
求可逆分布的方法:
-
取定o,记S0={o}。
-
归纳定义从o出发经过n步之后才能到达的状态,这样的状态构成集合Sn。
假设 ⋃n=0∞Sn=S。对任意 i∈Sn,随便取一个 k∈Sn−1 使得 pki>0,并令
πi=pikπkpki.
-
验证细致平衡条件,并进一步将 π 归一化,结论为以下三种情形之一。
情形一、存在两个状态 i,j 使得 πipij=πjpji。那么P 没有配称测度,从而也没有可逆分布。
情形二、细致平衡条件 (1.2.4) 成立,但 π 不可以归一化。那么P 有配称测度,但没有可逆分布。
情形三、细致平衡条件 (1.2.4) 成立,且 π 可以归一化。那么可取到恰当的 πo 使得 π 就是 P 的可逆分布。
配称测度具有继承性。D⊆S。我们将所有离开区域D的跳跃改成原地跳跃,则仍然是可逆分布。但这对不变分布不成立。
- 定理1**(更新定理)**. 假设L1,⋯独立同分布,取非负整数,P(L1=0)<1。令S0=0,Sr=L1+⋯+Lr。令Rn=max{r≥0:Sr≤n}。则有
P(n→∞limnRn=EL11)=1
更新定理常常用于揭示不变分布与状态访问频率之间的关系。nRn代表访问频率,而EL1则往往就是不变分布中该状态的概率。